## 武汉大学计算机学院

## 2020-2021 学年第一学期 2019 级《计算机组成与设计》

# 期末考试试题 B 卷 (闭卷)

| 学号         | 班级                                                                   | 姓名                     | 成绩                |               |
|------------|----------------------------------------------------------------------|------------------------|-------------------|---------------|
| 注意: 所有     | <b>育答题内容必须写在答</b>                                                    | \$题纸上,凡写在试 <b>是</b>    | <b>匢或草稿纸上的一</b> 律 | !无效。          |
|            |                                                                      |                        |                   |               |
| 一、单项选择     | 题(每小题2分,                                                             | 共20分)                  |                   |               |
| 1、下列部件中等   | 实现指令执行控制的是                                                           | 是 ( ) /                |                   |               |
| A、存储器      | B、数据通路                                                               | C、控制器                  | D、输入/输出部件         |               |
| 2、对给定的应用   | 用,若增加多个处理器                                                           | 器 <del>来分别</del> 处理独立的 | 任务,则将对(           | )产生影响。        |
| (A) ?      | ,                                                                    |                        | Ps, Dal           | 理点更快          |
| A、响应时门     | 可                                                                    | B、吞吐率                  | 101.              | eft of E      |
| C、响应时间     |                                                                      | D、以上都不对                | Dog               | 7处华东兴         |
| 设\$s0的内容   | <sub>:为</sub> 0x10010010 <sub>,则</sub><br>0014 <sub>B</sub> 、0x10020 | 指令 lw \$t0, -12(\$s0)  | 读内存数据使用的          | 地址为( ) 乙      |
|            |                                                                      |                        | <u>-</u>          | x10010004     |
|            | 旨令格式,下列说法中                                                           | 」正确的是( 🄰 🎵 🧵           | ) risc-v          |               |
|            | 令都有 funct 字段                                                         |                        |                   |               |
|            | 旨令都有 rd 字段                                                           |                        |                   |               |
|            | 令都有 rs 字段                                                            |                        |                   |               |
|            | 冷都有 op 字段                                                            | 001000                 | 7) ()             |               |
|            | 上进制补码表示形式为                                                           | 60011                  | 00                |               |
|            | 11 B. 00100000                                                       | C、11100000° D、         | 11100001          |               |
|            | 上进制补码表示形式为                                                           |                        |                   |               |
|            |                                                                      | C、11100000 D、11        |                   |               |
|            | 期数据通路如下图所表                                                           |                        |                   |               |
| <b>(</b> ) | 美的最小时钟周期是多<br>                                                       | 少?(本考思JAL指             | 令)。假设没有列出         | <u>的部件</u> 延时 |
| 为0ns。()/   |                                                                      |                        |                   |               |
| ALU: 5hs   | ()+- <del> </del> + +                                                |                        |                   |               |
|            | (读或者写): 10ns                                                         |                        |                   |               |
|            | (读或者写): 10ns                                                         |                        |                   |               |
| 寄存器文件      |                                                                      |                        |                   |               |
| 地址加法器      | (non-ALU): 1ns                                                       |                        |                   |               |



A、26ns B、28ns

C、29ns

D、31ns

10+3+5+10+3

8、假设流水线处理器中增加流水的级数,将对(())产生的影响。

A 时钟周期将变短

B、每个程序的指令数将减少

- C、CPI将变小
- D、以上所有情况都会发生
- 9、下列有关存储器的说法正确的是(

A.、存储器层次结构中,存储器的容量、访问时间和单位成本都随着离处理器距离的 增加而增加。

B. 主存储器一般由 SRAM (静态随机存取存储器)来实现,它的特点是每比特占用 的存储空间较少,因此等量的硅制造的 SRAM 的容量比 DRAM 的大。

C.、相对于服务器,嵌入式系统的存储器通常设计的容量比较小和简单,以降低功耗。

D/ 具有相同复杂度的算法,在同一机器上运行的时间也会基本一致。

10、一台有完整的层次储存器的 MIPS 计算机,执行一条 LW 指令访问主存的可能最多次

数为♪

B、1

二、性能计算(每小题 5 分,共 10 分)

有 3 种不同的处理器 P1、P2 和 P3 执行同样的指令集,有如表所示性能特点

| 处理器 | 时钟频率   | CPI |
|-----|--------|-----|
| P1  | 3GHz   | 1.5 |
| P2  | 2.5GHz | 1.0 |

(PV)日村日=(PIXTE)

 (1) 以每秒钟执行的指令数目为标准,那个处理器性能最高?
 2.0

 (1) 以每秒钟执行的指令数目为标准,那个处理器性能最高?
 36

(2) 如果每个处理器执行一个程序都在费 10 秒,求它们的时钟周期数和指令数。 写其月=B寸[2] X方穴字 3×10 2.5×10 3.6×10 0

CIZ 2x10'0 2.5x1," [8x10"0

三、指令系统(每个空1分,共15分)

对如下 C 语言程序:

```
for (i=0; i<a; i++) {
    j=0;
    while (j<b) {
        D[4*j]=i+j;
        j+=1;
    }
```

addix7,0,0// 1=0 addi \$t0, \$0, 0 slt \$t2, ((\$)\$\mathbf{f}\oldsymbol{o}\),\$s0 TESTI: Sub x10, x7, x5// i- 01 beg x10,x0, exitli i-a=0 \$t2, \$0, exit addi x8,0,0/1 j=0 addi \$t1, \$0, 0 TEST2: sab XII, X8, X6 /1j-4
beg X/1, X0, 600 P1/1 j=b
add x12, X7, X8/1 itj slt \$t2, \$t1, ((3)) TEST2: ( (4**)** \$t2, \$0, LOOP1 add \$t3, \$t0, ( \$\) slli 213, x8,5/14x8xj sll \$t2, ((67)), ((7)) 4)ad x13, x9, x13/1800000 add \$t2, \$t2, ( (8)\$\sqrt{5}\eta (9)\$6), (10)0(\$t2) Sd x12,00x13/1/22/15 LOOP1: EXIT:

#### 四、运算器(共10分)

用二进制浮点数加法计算(12.7510+6.510) 之值(保留7位精度);并把计算结果转换成

IEEE754 单精度浮点数的二进制位模式和十六进制数。 
$$\frac{12.75}{0.5} = \frac{100.[1 \text{ l. lool} \times 2.75]}{0.5} = \frac{100.[1 \text{ l. lool} \times 2.75]}{0.5} = \frac{100.[1 \text{ l. lool} \times 2.75]}{0.5} = \frac{100.[100]}{0.5} = \frac{100.[100]}{0.5}$$
 五、CPU( 共 23 分)

1、(8分)根据上图的数据通路,其中指令存储器、加法器、多选器、ALU、寄存器堆、 数据存储器和控制单元的延迟分别为 400ps, 100ps, 30ps, 120ps, 200ps, 350ps 和 100ps, 相应成本分别为 100, 30, 10, 100, 200, 2000 和 500。考虑给 ALU 增加一个乘法, 这将 使 ALU 的延迟增加到 200ps,同时 ALU 的成本增加 500,这样做的好处是需要执行的指令 数减少了5%, 因为不需要再模拟 MUL 指令。

- (1) 改进前后的时钟周期分别是多少?的"1" 400ps+20+30+120+350+20=1130
- (2) 改讲后获得多大的加速比?
- (3) 改进前后的性价比是多少?
- 2、(共15分)流水线示意图如下:

台: [130+200=1330 2] 1330×0.95 = 0-89 经能差

(共15分) 流水线示意图如下: お 3kmf50v = 約70 作様 <u>9390</u> = 1.13 **Datapath with Hazard Detection** 1.13 0.89 4.27



在此流水线上执行下面的指令序列:

add \$10,\$0,\$0

addi \$11,\$0,100

lw \$10,0(\$11)

同氧工

addi \$10,\$11,-1

add \$10,\$11,\$11

beq \$11,\$10,exit

从取第一条指令开始计时,请在下面的表格中填写各时钟周期转发单元的输入输出信号 状态值:

| 时钟周期            | Clk5 | Clk6 | Clk7 | Clk8 | Clk9 |
|-----------------|------|------|------|------|------|
| ID/EX.Rs        |      |      | 7/   |      |      |
| ID/EX.Rt        |      |      | 7    |      |      |
| EX/MEM.Rd       |      |      |      |      |      |
| EX/MEM.RegWrite |      |      |      |      |      |
| MEM/WB.Rd       |      |      |      |      |      |
| MEM/WB.RegWrite |      |      |      |      |      |
| ForwardA        |      |      |      |      |      |
| ForwardB        |      |      |      |      |      |

## 六、 (本题 22 分)

1、(6分) 直接映射 cache 的索引方法是用 (块地址) mod (cache 中的块数)。假设 cache 地址为 32 位,有 256 个块,块大小为 64 字节。考虑一个不同的索引函数:

(块地址)[31:24] XOR 块地址[23:16]

2、(16 分)假设虚拟存储器的页面为 8KB,TLB 和页表(按列顺序)初始状态如下,访问的虚拟地址流如下(十六进制): A4EC、C5A6、E8F4、9100,说明每个地址的访问过程并列出访问 4 个数据之后 TLB 的状态,在 TLB 表后面增加一列说明其命中情况(设TLB 命中表示为 H、TLB 不命中但页表命中表示为 M,发生缺页表示为 PF)。如果要从磁盘中取回页,设物理页面 8、10 可用。

| TLB |   |       |       |  |  |  |  |
|-----|---|-------|-------|--|--|--|--|
| 有   | 效 | 标记位   | 物理页号  |  |  |  |  |
| 位   |   | (十进制) | (十进制) |  |  |  |  |
| 1   |   | 11    | 12    |  |  |  |  |
| 1   |   | 5     | 11    |  |  |  |  |
| 1   |   | 7     | 4     |  |  |  |  |
| 0   |   | 4     | 9     |  |  |  |  |

| 页表 |   |    |   |   |   |    |   |   |   |    |   |
|----|---|----|---|---|---|----|---|---|---|----|---|
| 有  | 效 | 物  | 理 | 有 | 效 | 物  | 理 | 有 | 效 | 物  | 理 |
| 位  |   | 页  |   | 位 |   | 页  |   | 位 |   | 页  |   |
| 1  |   | 5  |   | 1 |   | 9  |   | 1 |   | 8  |   |
| 0  |   | 磁盘 | 計 | 1 |   | 11 |   | 0 |   | 磁盘 | 計 |
| 0  |   | 磁盘 | 計 | 0 |   | 磁盘 | 計 | 1 |   | 3  |   |
| 1  |   | 6  |   | 1 |   | 4  |   | 1 |   | 12 |   |

- (1) 如果 TLB 采取全相联映射方式;
- (2) 如果 TLB 采取直接映射方式;
- (3) 如果 TLB 采取两路组相联映射方式(原 TLB 的四块分别为: 0组 0块、1组 0块、0组 1块、1组 1块、)。

37 1 le index 5,10+1 6:11+0 7:11+1 4:10+0 TLB 5: TLB: M b: PF 7: M 4:M 1 3 8 PF (2 11 M
第6页共6页 1 3 4 M